Découverte de données et classification des données

Avec le règlement général sur la protection des données qui se profile, les organisations commencent à réaliser que celles qui s’appuient sur la classification pour la divulgation des données atteignent leurs limites. En matière de cybersécurité, la « découverte des données » peut parfois être aussi importante que la « classification » pour sécuriser vos données. Par conséquent, lorsqu’il s’agit de comprendre l’identité et le contexte et le contenu des données, il est nécessaire d’éradiquer les corrélations d’identité et pas seulement les classifications. [Sources : 13,17,17]

L’une des premières étapes consiste à créer un catalogue vivant de contenus sensibles qui peuvent être identifiés et découverts pour être surveillés et protégés. [Sources : 10,15,12]

Avant de considérer les avantages de l’automatisation, il est important de comprendre ce qu’il faut d’abord savoir sur la différence entre la reconnaissance et la classification des données dans le contexte de l’acquisition et de l’analyse des données. [Sources : 8,8,8]

Découvrez nos solutions sans obligation d’achat

La classification des données doit être conforme aux exigences réglementaires et sectorielles pertinentes, qui exigent la classification de différents attributs de données. Le type de classification des données est adapté aux différents types de données et quels moyens techniques doivent être utilisés pour classifier les données. La classification des données est effectuée sous la direction des chefs de programme, qui sont responsables de la classification des données des différents programmes et unités organisationnelles. Ceci définit le rôle et les responsabilités de chacun d’entre eux et la politique qui détermine également leur processus de classification des données. [Sources : 15,15,15]

Un processus de repérage est effectué pour identifier les données et recueillir des informations sur leur emplacement. Une classification des données est ensuite établie pour déterminer si les données en question sont réellement nécessaires ou non. Afin de garantir la conformité avec les exigences en matière de protection des données et de protection des données, les travaux sont produits de diverses manières pour identifier les données sensibles. [Sources : 6,0]

Dans l’explorateur d’objets de SSMS, sélectionnez « Tâches de découverte et de classification des données » et sélectionnez « Classification des données ». En cliquant sur « Classification des données », le moteur de classification analyse la base de données à la recherche de colonnes de données sensibles et génère un rapport sur la classification des données qui contient une liste de colonnes recommandées pour la classification. Vous pouvez constater que la fonction de découverte et de classification des données ne marque aucune des colonnes créées pendant le test. [Sources : 4,7,5]

En plus de faciliter la localisation et la récupération de vos données, un système de classification des données soigneusement planifié facilite également la manipulation et le suivi des données importantes. L’association de la découverte et de la classification des données apporte de nombreux avantages à votre organisation en matière de sécurité, comme une visibilité accrue pour vous aider à répondre aux exigences de conformité, etc. [Sources : 14,9]

La classification des données peut être utilisée pour catégoriser davantage les données structurées, et les outils de détection des données aident votre équipe de sécurité à savoir où se trouvent les données sensibles. La classification des données est un excellent moyen de tirer le meilleur parti des données non structurées pour maximiser leur utilité et leur organisation, mais il est préférable de classer les données à deux niveaux différents afin que les bases de données, les fichiers et les autres ressources de données contiennent des données classées à un niveau supérieur. La découverte et la classification mettent toutes deux l’accent sur les données non classifiées ; toutefois, si vous surveillez toujours les données classifiées et non classifiées, vous ne serez pas en mesure de détecter les abus. [Sources : 13,9,15,14]

La découverte de données est le processus qui permet de connaître le « où et pourquoi » des données, et elle nécessite de comprendre les relations entre les données et la modélisation des données, ainsi que l’utilisation d’analyses avancées pour vous aider à révéler des informations. [Sources : 11,9]

La découverte des données est le processus d’analyse de votre environnement pour déterminer où se trouvent les données (structurées ou non), comme les bases de données, les fichiers et les serveurs qui peuvent contenir des données sensibles ou réglementées. La classification des données est effectuée en pointant un outil sur une base de données, qui inverse la base de données – et peut deviner ce qu’elle contient au moyen des noms de colonnes. Les outils basés sur la classification sont généralement optimisés pour des types de données spécifiques, tels que les types de données ou les structures de données. Parmi les entreprises qui utilisent des logiciels de business intelligence pour la classification des données, citons Google, Facebook, Microsoft, Apple, Google Analytics, IBM, Oracle, SAP, Salesforce et bien d’autres. [Sources : 1,12,17,14]

Les entreprises se heurtent à un obstacle dans la classification des données sensibles qu’elles ont trouvées. En identifiant et en localisant ces données, les entreprises peuvent améliorer leur capacité à utiliser ces informations comme une ressource qui crée une bonne volonté concrète, et elles peuvent utiliser ces informations plus efficacement pour obtenir une valeur concrète pour l’entreprise. [Sources : 0,8]

Sources :

  • [0] : https://www.reply.com/en/topics/security/gdpr-data-discovery-and-data-governance
  • [1] : https://securityintelligence.com/posts/data-discovery-and-classification-are-complicated-but-critical-to-your-data-protection-program/
  • [2] : https://www.softwareadvice.com/bi/data-discovery-tools-comparison/
  • [3] : https://dzone.com/articles/manage-your-sensitive-data-with-sql-data-discovery
  • [4] : https://docs.microsoft.com/en-us/sql/relational-databases/security/sql-data-discovery-and-classification
  • [5] : https://thomaslarock.com/2018/02/sql-data-discovery-and-classification/
  • [6] : https://docs.aws.amazon.com/macie/latest/user/data-classification.html
  • [7] : https://sqlskull.com/2020/07/17/sql-data-discovery-and-classification/
  • [8] : https://www.spirion.com/blog/automating-data-discovery-and-data-classification-for-enhanced-privacy/
  • [9] : https://digitalguardian.com/blog/data-discovery-and-classification-working-hand-in-hand
  • [10] : https://gttb.com/data-discovery-data-classification/
  • [11] : https://bi-survey.com/data-discovery
  • [12] : https://www.dataversity.net/data-architects-its-time-to-improve-your-data-classification/
  • [13] : https://nightfall.ai/data-discovery-and-classification-secure-pii
  • [14] : https://searchdatamanagement.techtarget.com/definition/data-classification
  • [15] : https://www.imperva.com/learn/data-security/data-classification/
  • [16] : https://docs.microsoft.com/en-us/azure/azure-sql/database/data-discovery-and-classification-overview
  • [17] : https://bigid.com/blog/data_classification/